Sistema de Recomendación de Películas:

Beatriz Cárdaba y Sara Bengoechea

Objetivo:

El objetivo de este trabajo es al creción de un sistema de recomención de películas en base a diferentes criterios. Para ello se estudiarán e implementarán diferentes algoritmos. La bases de datos utilizada es de Kagle, se utilñizarán datos de 45.000 películas, género, arget de edad, popularidad... y datos de las votaciones por ususario para definir algoritmos basados en las peliculas y en los ususarios que las visualizan.

Índice:

  1. Introducción a los sistemas de recomendación.
  2. Análisis exploratorio del dataset y data engineering.
  3. Demographic Filtering
  4. Content Based Filtering
  5. Collaborative filtering
  6. Conclusiones

Librerías:

Introducción a los sistemas de recomendación.

Un sistema de recomendación, es un tipo de sistema de filtrado de información que trata de predecir la "calificación" o "preferencia" que un usuario daría a un artículo, y se utiliza principalmente en aplicaciones comerciales.

Los sistemas de recomendación se utilizan en diversos ámbitos y se reconocen más comúnmente como generadores de listas de reproducción para servicios de vídeo,música, recomendadores de productos para tiendas en línea o recomendadores de contenido para plataformas de medios sociales y recomendadores de contenido web abierto. Estos sistemas pueden funcionar utilizando una sola entrada, como la música, o múltiples entradas dentro y a través de plataformas como las noticias, los libros y las consultas de búsqueda. También hay sistemas de recomendación populares para temas específicos como restaurantes y citas online. También se han desarrollado sistemas de recomendación para explorar artículos de investigación y expertos, colaboradores, aseoseres y servicios financieros.

Un sistema de recomendación genera una lista compilada de artículos en los que un usuario podría estar interesado, en la reciprocidad de su selección actual de artículos. Amplía las sugerencias de los usuarios sin ninguna perturbación ni monotonía, y no recomienda artículos que el usuario ya conoce.

Complicaciones

Los sistemas de recomendación son sistemas basados en machine learning que exploran todas las opciones posibles y proporcionan una predicción o recomendación. Sin embargo, la construcción de un sistema de recomendación tiene las siguientes complicaciones:

Según el tipo de filtrado y klos datos utilizados encontramos diferentes tipos de sistemas de recomendación:

Hay básicamente tres tipos de sistemas de recomendación:-

En este proyecto desarrollaremos diferentes alfogritmos basasdos en estos tiops tipos de filtros además de utilizar sistemas combiando algunos tipos de filtros.

A continuación, se va a realizar un EDA de los datos que se van a utilizar en este sistemas de recomendación.

EDA

Se va arealizar un análisi exploratorio de la base de datos 'Movies' que hemos obtenido en Kaggle, que consta con 45.000 peñiculas extraídas de TMBD (The Movie Data Base)

Importamos los datos:

En primer lugar importamos los datos en formato csv:

Diccionario de Variables:

Palabras más usadas en los títulos de las películas

El siguiente esquema muestra que las palabras más usadas en los títulos de las películas son:

Palabras más usadas en las descripciones de las películas

El siguiente esquema muestra que las palabras más usadas en los títulos de las películas son:

Mapa de los países que más peliculas producen:

Popularidad, promedio de votos y recuento de votos

En esta sección, trabajaremos con las métricas que nos proporcionen los usuarios del TMDB. Intentaremos comprender mejor la popularidad, la media de votos y las características del recuento de votos e intentaremos deducir cualquier relación entre ellas, así como otras características numéricas como el presupuesto y los ingresos.

En primer lugar aplicamos una fórmula para transformar todos los datos de estas columnas a tipo numérico:

Películas por popularidad

La puntuación de popularidad es asignada por el TMDB

Películas más votadas

Películas con mayor nota media:

Películas con mayor presupuesto

Correlaciones entre variables numéricas:

Géneros

Bibliografiía: